Ａｐａｃｈｅ　Ｓｐａｒｋ徹底入門

Ｊｕｌｅｓ　Ｓ．Ｄａｍｊｉ／〔ほか〕著　長谷川亮／〔ほか〕訳

著作者: Ｊｕｌｅｓ　Ｓ．Ｄａｍｊｉ／〔ほか〕著　長谷川亮／〔ほか〕訳

メーカー名/出版社名: 翔泳社

出版年月: 2024年4月

ISBNコード: 978-4-7981-8228-5
(4-7981-8228-1)

頁数・縦: ４４７Ｐ　２３ｃｍ

分類: コンピュータ／データベース／データ分析

出荷の目安: 5～10営業日前後で発送いたします。
お受け取りいただける日はお届けする国・量・時期により多少前後します。

価格¥4,000

数量

出版社の商品紹介

出版社からのコメント

Ａｐａｃｈｅ　Ｓｐａｒｋの仕組みとビッグデータ向けの大規模処理とＭＬ開発を徹底解説本書は、ビッグデータを主な対象としたデータ分析フレームワークであるＡｐａｃｈｅ　Ｓｐａｒｋ、ｍｌｆｌｏｗ、ｄｅｌｔａ　ｌａｋｅの中級入門書です。「動かしてみる」だけではなく、どのような仕組みになっているのか、どうすれば効率的な実装が行えるかまで踏み込みつつ、データＡＩの実装者がＡｐａｃｈｅ　Ｓｐａｒｋ、ＭＬｆｌｏｗ　およびｄｅｌｔａ　ｌａｋｅを使いこなすための解説を行います。本書では、単純なデータ分析と複雑なデータ分析を実行し、どのように機械学習アルゴリズムを採用していくか、解説していきます。Ａｐａｃｈｅ　Ｓｐａｒｋの導入から解説をはじめ、Ｓｐａｒｋ　ＳＱＬとデータフレーム、データセットを紹介していきます。そこから、Ａｐａｃｈｅ　Ｓｐａｒｋを利用した実践的な機械学習の方法を解説していきます。本書での学習を通じて、次のことが学習できます。・Ｐｙｔｈｏｎ、ＳＱＬ、Ｓｃａｌａ、またはＪａｖａの高レベルの構造化ＡＰＩの学習・Ｓｐａｒｋ　の操作とＳＱＬエンジンの理解・Ｓｐａｒｋ　構成とＳｐａｒｋ　ＵＩを使用したＳｐａｒｋ操作の検査、調整、デバッグ・ＪＳＯＮ、Ｐａｒｑｕｅｔ、ＣＳＶ、Ａｖｒｏ、ＯＲＣ、Ｈｉｖｅ、Ｓ３、またはＫａｆｋａといったデータソースへの接続・構造化ストリーミングを使用してバッチ　データとストリーミング　データの分析を実・オープンソースのＤｅｌｔａ　ＬａｋｅとＳｐａｒｋを使用して信頼性の高いデータ　パイプラインを構築・ＭＬｌｉｂを使用する機械学習パイプラインの開発、ＭＬｆｌｏｗを使用するモデルの管理、本番化・［日本語版オリジナルコンテンツ］ｐａｎｄａｓ　ｄａｔａｆｒａｍｅ、ｓｐａｒｋ　ｄａｔａｆｒａｍｅに関する各種データフレームの使い分け　・［日本語版オリジナルコンテンツ］ＬＬＭやＥｎｇｌｉｓｈ　ＳＤＫ　ｆｏｒ　ＳｐａｒｋなどＡＩを活用した新たなコーディングスタイル、ＬＬＭの利用方法の実践※本書は『Ｌｅａｒｎｉｎｇ　Ｓｐａｒｋ：　Ｌｉｇｈｔｎｉｎｇ−Ｆａｓｔ　Ｄａｔａ　Ａｎａｒｙｔｉｃｓ　２ｎｄ　Ｅｄｉｔｉｏｎ』の邦訳です。

※商品代の他に送料がかかります。
送料は商品代・送付先によって変わります。詳しくは書籍の料金についてのご案内をご確認ください。
※現時点でお取り扱いがない場合でも、今後購入可能となる場合がございます。
※送付先を追加・変更される場合はご購入前にマイページよりご登録をお願いいたします。
※商品は予告なく取り扱い中止となる場合がございます。
※ご注文商品が在庫切れなどの際はキャンセルのご連絡をさせていただく場合がございます。

Ａｐａｃｈｅ Ｓｐａｒｋ徹底入門

出版社の商品紹介

出版社からのコメント

Ａｐａｃｈｅ　Ｓｐａｒｋ徹底入門